LeNet代码实现

这里不会包含任何讲解的内容，讲解的内容请参考LeNet：初试卷积神经网络。

比较“标准”且常见的写法（96行）

import tensorflow as tf
from tensorflow.keras import datasets, layers, initializers

# 加载数据集
(training_x, training_y), (testing_x, testing_y) = datasets.mnist.load_data()
training_x = (training_x.astype('float32') / 255.)
testing_x = (testing_x.astype('float32') / 255.)
training_x = tf.reshape(training_x, (training_x.shape[0], training_x.shape[1], training_x.shape[2], 1))
testing_x = tf.reshape(testing_x, (testing_x.shape[0], testing_x.shape[1], testing_x.shape[2], 1))
batch_size = 100

# 构造训练用数据集
training_dataset = tf.data.Dataset.from_tensor_slices((training_x, training_y))
training_dataset = training_dataset.batch(batch_size)
testing_dataset = tf.data.Dataset.from_tensor_slices((testing_x, testing_y))
testing_dataset = testing_dataset.batch(batch_size)

class LeNetModel(tf.keras.Model):
    def __init__(self):
        super(LeNetModel, self).__init__()
        # 1.第一个卷积层
        self.conv1 = layers.Conv2D(filters=32, kernel_size=(5, 5), padding='SAME', activation=tf.nn.sigmoid, use_bias=True, bias_initializer=initializers.Zeros)
        # 2.最大池化
        self.maxpool1 = layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding='SAME')
        # 3.第二个卷积层
        self.conv2 = layers.Conv2D(filters=64, kernel_size=(5, 5), padding='SAME', activation=tf.nn.sigmoid, use_bias=True, bias_initializer=initializers.Zeros)
        # 4.最大池化
        self.maxpool2 = self.maxpool1 = layers.MaxPool2D(pool_size=(2, 2), strides=(2, 2), padding='SAME')
        # 5.打平以便进入全连接
        self.flatten = layers.Flatten()
        # 6.第一个全连接层
        self.fc1 = layers.Dense(units=512, activation=tf.nn.sigmoid, use_bias=True, bias_initializer=initializers.Zeros)
        # 7.第一个全连接层
        self.fc2 = layers.Dense(units=10, activation=tf.nn.sigmoid, use_bias=True, bias_initializer=initializers.Zeros)

    # 定义前向传播的方法
    def call(self, inputs, training=None, mask=None):
        result = self.conv1(inputs)
        result = self.maxpool1(result)
        result = self.conv2(result)
        result = self.maxpool2(result)
        result = self.flatten(result)
        result = self.fc1(result)
        result = self.fc2(result)
        return result
# 创建一个模型实例
model = LeNetModel()

# 定义损失函数
loss_fun = tf.losses.SparseCategoricalCrossentropy(name='loss_fun')
train_loss = tf.metrics.Mean(name='train_loss')
train_acc = tf.metrics.SparseCategoricalAccuracy(name='train_acc')
test_loss = tf.metrics.Mean(name='train_loss')
test_acc = tf.metrics.SparseCategoricalAccuracy(name='train_acc')

# 定义优化器
optimizer = tf.optimizers.Adam()

# 训练方法
@tf.function
def training_step(images, labels):
    with tf.GradientTape() as tape:
        pred = model(images)
        loss = loss_fun(labels, pred)
        gradients = tape.gradient(loss, model.trainable_variables)
        # 使用优化器进行反向传播
        optimizer.apply_gradients(zip(gradients, model.trainable_variables))
        # 计算训练损失和准确率
        train_loss(loss)
        train_acc(labels, pred)

# 验证方法
@tf.function
def verify_on_test(images, labels):
    pred = model(images)
    # 计算损失和准确率
    loss = loss_fun(labels, pred)
    test_loss(loss)
    test_acc(labels, pred)


epochs = 40
for ep in range(epochs):
    for images, labels in training_dataset:
        # 训练
        training_step(images, labels)
    for images, labels in testing_dataset:
        # 验证
        verify_on_test(images, labels)
    # 打印每一个Epoch的结果
    template = 'Epoch{}, loss:{}, Acc:{}%, test_loss:{}, test_acc:{}%'
    print(template.format(ep + 1,
                          train_loss.result(),
                          train_acc.result() * 100.,
                          test_loss.result(),
                          test_acc.result() * 100.))

提高Keras API使用率以节省代码量的版本（带注释32行）

import tensorflow as tf
from tensorflow.keras import datasets

# 加载数据集
(training_x, training_y), (testing_x, testing_y) = datasets.mnist.load_data()
training_x = (training_x.astype('float32') / 255.)
testing_x = (testing_x.astype('float32') / 255.)
training_x = tf.reshape(training_x, (training_x.shape[0], training_x.shape[1], training_x.shape[2], 1))
testing_x = tf.reshape(testing_x, (testing_x.shape[0], testing_x.shape[1], testing_x.shape[2], 1))

model = tf.keras.models.Sequential([
    # 1.第一个卷积层
    tf.keras.layers.Conv2D(filters=32, kernel_size=5, activation='sigmoid', input_shape=(28, 28, 1)),
    # 2.最大池化
    tf.keras.layers.MaxPool2D(pool_size=2, strides=2),
    # 3.第二个卷积层
    tf.keras.layers.Conv2D(filters=64, kernel_size=5, activation='sigmoid'),
    # 4.最大池化
    tf.keras.layers.MaxPool2D(pool_size=2, strides=2),
    # 5.打平以便进入全连接
    tf.keras.layers.Flatten(),
    # 6.第一个全连接层
    tf.keras.layers.Dense(512, activation='sigmoid'),
    # 7.第一个全连接层
    tf.keras.layers.Dense(10, activation='sigmoid')
])
# 编译模型
model.compile(optimizer='Adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
# 训练模型
model.fit(training_x, training_y, epochs=5, validation_split=0.1)
测试模型
model.evaluate(testing_x, testing_y, verbose=2)

在接下来的几篇文章中，为了简洁性，我将尽量使用Keras API完成所有功能。

LeNet代码实现

比较“标准”且常见的写法（96行）​

提高Keras API使用率以节省代码量的版本（带注释32行）​

比较“标准”且常见的写法（96行）

提高Keras API使用率以节省代码量的版本（带注释32行）